软件工程数据挖掘若干问题研究

软件工程数据挖掘若干问题研究

作者:师大云端图书馆 时间:2015-12-28 分类:期刊论文 喜欢:2102
师大云端图书馆

【摘要】软件工程数据是软件工程整个过程中所产生的各种数据,包括软件的源代码、文档、缺陷报告等。在绝大多数情况下,软件工程数据是开发者获取信息的唯一来源。随着计算机软件规模的不断扩大,手工获取开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息,加快软件开发进程,提高软件质量。本文针对软件工程数据挖掘的若干问题进行研究,主要贡献如下:1.提出了一种Java源代码中Method的自动命名方法。软件源代码中标识符的正确命名对软件维护非常重要,恰当的Method名能够使开发者了解Method的功能,而不恰当的命名则会误导他们。但是,开发者除了个人的经验技术之外,他们在为Method命名时几乎无所凭依。本文提出了一种基于文本分类的方法,为Method选择恰当的动作名。实验表明,本文方法的命名正确率达到70%以上。2.提出了一种程序盗用检测方法。与软件业、特别是开源软件的蓬勃发展相比,用以保护现有软件免遭软件盗用者侵害的检测工具少得可怜。一个不自律的开发者可以通过代码伪装技术盗用他人的源码,而又逃脱法律的制裁。现有的基于程序依赖图的检测工具可以检出若干种专业的代码伪装,但时间效率无法让人满意,并且它们无法识破影响程序依赖图结构的伪装。本文提出了一种新的盗用检测工具TPLAG,它不仅将代码盗用检测的时间复杂度从指数级降到多项式级,而且能成功地识破影响图结构的代码伪装技术。3.提出了一种缺陷分派方法。大型软件的开发组每天都会收到成百上千的缺陷报告,对这些缺陷进行分派是软件开发者们的一项沉重的负担。现有的研究工作将软件缺陷自动分派归结为文本分类问题。本文利用LatentDirichletAllocation(LDA)进行文本降维,在此基础上基于文本分类方法进行缺陷分派,提高了分派的准确率。4.提出了一种缺陷报告质量评估方法。软件维护工作的质量与缺陷报告本身的质量高度相关,不包含有用信息、质量低下的缺陷报告很可能被开发者直接忽略,相应的缺陷也就无法得到修复。本文提出了一种基于主题模型的方法对缺陷报告的内容进行分析,并量化缺陷报告的信息量,即缺陷报告质量。5.提出了一种缺陷报告库上主题发现与跟踪的方法。本文试图从缺陷报告库中提取两方面的内容:缺陷的主题和某一主题缺陷爆发的时段,这些内容能够为软件项目的管理者提供高层次的信息,以了解软件维护的整体情况。我们采用LDA模型提取缺陷报告内容中的主题,并开发了一种事件检测算法以检测缺陷集中爆发的时段。
【作者】郁抒思;
【导师】周水庚;
【作者基本信息】复旦大学,计算机软件与理论,2011,博士
【关键词】软件工程;数据挖掘;

【参考文献】
[1]苏劲松.前炎清片治疗慢性前列腺炎肾虚湿热血瘀证的临床研究[D].湖南中医药大学,中西医结合临床,2013,硕士.
[2]戴光坤.八氯苯乙烯羧酸类半抗原的设计与合成[D].湖南大学,有机化学,2012,硕士.
[3]李莹杰,刘洪业,郝生跃.基于因子分析法和聚类分析的我国各省市建筑业竞争力评价研究[J].土木工程与管理学报,2014,02:78-83.
[4]黄捷.江津市城镇化道路及对策研究[D].西南师范大学,2004.
[5]唐文胜.不同套袋处理对香柚果实品质的影响[D].湖南农业大学,种植,2003,硕士.
[6]雷轶,李津发,陈云川.知识管理在CRM中的应用[J].计算机与现代化,2004,11:27-29.
[7]刘转玲.mBBM方程和Mkdv方程的新解析解[D].兰州大学,应用数学,2012,硕士.
[8]薛彤.审计定价与会计师事务所规模相关性的研究[D].西北大学,会计学,2013,硕士.
[9]吴明高.阻抗网络型单相三电平逆变器研究[D].燕山大学,电气工程,2014,硕士.
[10]郑雪.晶体硅太阳电池表面钝化技术的研究[D].浙江大学,材料科学与工程,2013,硕士.
[11]高子茜.对外汉语教材对比研究[D].河北大学,汉语国际教育(专业学位),2014,硕士.
[12]王昕.多媒体通信[J].现代电信科技.1998(08)
[13]李文新.再生障碍性贫血活化T细胞长期生存机制及其潜在凋亡介导功能的研究[D].苏州大学,免疫学,2003,硕士.
[14]段广超.葛优系列银幕形象的风格特征研究[D].吉林大学,广播电视,2014,硕士.
[15]王威.基于Monte Carlo方法的层状混自旋磁性材料的物性研究[D].沈阳工业大学,电工理论与新技术,2013,博士.
[16]丁博.掺杂NaTaO3的电子结构及相关性质的第一性原理研究[D].山东大学,原子与分子物理,2013,硕士.
[17]田方,张宇恒,周旗,王晓燕.下一代网络典型业务需求预测[J].世界电信.2006(06)
[18]郁倩文.鲁南地区王祥村“赶喜”习俗研究[D].山东艺术学院,艺术学,2012,硕士.
[19]张文嘉.股权结构差异对并购绩效的影响研究[D].华东理工大学,国际商务(专业学位),2013,硕士.
[20]王国权.铁路信号电缆对外来地电容不平衡的探讨[J].铁道通信信号.2008(07)
[21]施占一.基于远程监控与在线编程的中央空调通用控制器的研究[D].杭州电子科技大学,计算机应用技术,2013,硕士.
[22]王永琦.基于听觉模型反演方法的语音信号的分析及其应用[D].苏州大学,通信与信息系统,2003,硕士.
[23]朱晓强,王行风.数据挖掘在GIS中的应用研究[J].计算机工程与应用,2003,28:208-210+213.
[24]杨鑫宝.基于药物代谢酶的双参通冠方中延胡索与人参的相互作用研究[D].北京中医药大学,中药药理学,2013,硕士.
[25]都妤娜.招行大连分行国际业务客户满意度调查分析[D].大连理工大学,工商管理(专业学位),2012,硕士.
[26]张月燕.婴儿期面孔种族偏好的发展[D].浙江理工大学,应用心理学,2013,硕士.
[27]陈磊.红景天苷抗肝纤维化:涉及ROS相关的TGF-β1,NF-κB,MMPs/TIMPs及NO通路[D].兰州大学,外科学,2013,硕士.
[28]王峰浩.离子注入金刚石薄膜的微结构与光电性能研究[D].浙江工业大学,2013.
[29]李鹏飞.城市轨道交通再生制动实验系统设计与仿真[D].西南交通大学,系统工程,2013,硕士.
[30]王亚男.基于分子动力学的仿生水黾机器人划水运动微观机理研究[D].哈尔滨工业大学,机械电子工程,2014,硕士.
[31]余茜.Expectancy Norms in the Trans-editing of Online English Image News[D].西安外国语大学,MTI翻译,2014,硕士.
[32]信欣.我国绿色职业发展研究[D].天津职业技术师范大学,职业技术教育学,2012,硕士.
[33]陈荣芳.火星表面精确着陆制导控制问题研究[D].北京理工大学,控制科学与工程,2014,硕士.
[34]廖国平.清开灵注射液致小鼠IgE介导的过敏反应模型建立与绿原酸变应原性研究[D].南方医科大学,药剂学,2012,硕士.
[35]米红.脾虚大鼠胃粘膜易损伤性机制及黄芪总苷的作用[D].广州中医药大学,中西医结合基础,2013,硕士.
[36]吴亮.新信息冲击下沪深300股指期货价格发现功能研究[D].南京航空航天大学,数量经济学,2013,硕士.
[37]李蒙,姜立清,林琳,李永丰,何兴权.二茂铁基卟啉/石墨烯氧气还原电催化剂的制备及其在碱性和酸性条件下的电化学响应[A].中国化学会.中国化学会第29届学术年会摘要集——第23分会:电催化与洁净能源电化学转化[C].中国化学会:,2014:1.
[38]丰世利.湖北省邮政公司县域业务发展战略研究[D].华中科技大学,工商管理,2013,硕士.
[39]金利.面向现代移动终端的贴片天线改进设计[D].北京理工大学,电子与通信工程,2014,硕士.
[40]马淑静.功能对等理论指导下神秘学类文本的翻译[D].兰州大学,笔译(专业学位),2013,硕士.
[41]黄恒飞.3G时代国家信息安全策略研究[D].宁波大学,公共管理(专业学位),2013,硕士.
[42]秦欣欣.梅花鹿生茸区骨膜干细胞Galectin-1基因RNAi重组慢病毒载体的构建[D].江苏科技大学,生化与分子,2013,硕士.
[43]谢芹.完善我国房地产税制模式研究[D].华中师范大学,政治经济学,2013,硕士.
[44]吴景梅.项目管理在大庆新华08项目规划及应用[D].东北石油大学,项目管理(专业学位),2013,硕士.
[45]王琦,许杰,郭政,李霞.基因表达谱信息分析软件IDEA与WebGEA[J].生物信息学,2003,01:33-36.
[46]李乔.融合型内容分发网络关键技术研究[D].哈尔滨工业大学,2014.
[47]褚世刚.高层建筑在干扰效应下的舒适度研究[D].辽宁工程技术大学,结构工程,2012,硕士.
[48]李雷.弓网系统滑动电接触载流特性及摩擦磨损特性的研究[D].辽宁工程技术大学,电工理论与新技术,2012,硕士.
[49]麻珍玉.基于图式理论的高中英语词汇教学研究[D].西北师范大学,教育,2003,硕士.
[50]李雪妮.用于电解水制氢催化剂的制备及其性能研究[D].北京化工大学,材料科学与工程,2013,硕士.

相关推荐
更多